草庐IT

java - 处理 UTF-8 编码

全部标签

ruby - 如何使用 open-uri 处理 503 错误?

如果网站返回“503服务不可用”错误,则open-uri会抛出异常。例如:require'open-uri'open('http://www.google.co.uk/sorry/?continue=http://www.google.co.uk/search%3Fq%3Dhello%26oq%3Dhello%26ie%3DUTF-8')#OpenURI::HTTPError:503ServiceUnavailable#...但是,如果您随后在网络浏览器中访问它,它实际上会显示一个带有验证码的页面,而不是错误。我如何确保open-uri不只是将此作为异常抛出,而是实际处理响应并为我提供

ruby - Java .properties 文件等效于 Ruby?

我需要将一些简单的属性存储在文件中并通过Ruby访问它们。我非常喜欢.properties文件格式,它是Java中此类事物的标准(使用java.util.Properties类)...它简单、易于使用且易于阅读。那么,是否有某个地方的Ruby类可以让我从这样的文件中加载一些键值对而不需要很多努力?我不想使用XML,所以请不要建议REXML(我的目的不保证“尖括号税”)。我考虑过推出我自己的解决方案...它可能最多只有5-10行代码,但我仍然宁愿使用现有的库(如果它本质上是从文件构建的哈希)...因为这会将它减少到1行....更新:它实际上是一个直接的Ruby应用程序,而不是Rails,

ruby-on-rails - Ruby 2.0.0 字符串#Match ArgumentError : invalid byte sequence in UTF-8

我经常看到这种情况,但还没有想出一个优雅的解决方案。如果用户输入包含无效的字节序列,我需要能够让它不引发异常。例如:#@raw_responsecomesfromuserandcontainsinvalidUTF-8#forexample:@raw_response="\xBF"regex.match(@raw_response)ArgumentError:invalidbytesequenceinUTF-8已经问了很多类似的问题,结果似乎是对字符串进行编码或强制编码。然而,这些都不适合我:regex.match(@raw_response.force_encoding("UTF-8"

ruby-on-rails - 在 Ruby on Rails 中, '#encoding: utf-8' 和 'config.encoding = "utf-8"' 是否不同?

我可以通过在其顶部添加注释行来指定任何ruby​​文件使用特定编码:#encoding:utf-8但是在Rails的config/application.rb中,我发现了这个:config.encoding="utf-8"它们有什么不同吗?如果我设置了config.encoding="utf-8",我还需要#encoding:utf-8吗? 最佳答案 config/application.rb中的config.encoding="utf-8"部分与Rails应如何解释内容有关。ruby文件中的#encoding:utf-8告诉rub

ruby-on-rails - 获取 fields_for 和 accepts_nested_attributes_for 以处理 belongs_to 关系

我似乎无法使用Rails2.3的新accepts_nested_attributes_for工具在RailsView中为belongs_to关系生成嵌套表单。我确实检查了许多可用的资源,看起来我的代码应该可以工作,但是fields_for对我来说是爆炸性的,我怀疑它与如何做有关我配置了嵌套模型。我遇到的错误是一个常见的错误,可能有多种原因:'@account[owner]'isnotallowedasaninstancevariablename下面是涉及的两个模型:classAccount'User',:foreign_key=>'owner_id'accepts_nested_att

ruby - 有没有办法从 UTF-8 编码的文件中删除 BOM?

有没有办法从UTF-8编码的文件中删除BOM?我知道我所有的JSON文件都是用UTF-8编码的,但是编辑JSON文件的数据录入人员将它保存为UTF-8和BOM。当我运行我的Ruby脚本来解析JSON时,它因错误而失败。我不想手动打开超过58个JSON文件并转换为没有BOM的UTF-8。 最佳答案 对于ruby​​>=1.9.2,您可以使用模式r:bom|utf-8这应该有效(我还没有结合json测试它):json=nil#definethevariableoutsidetheblocktokeepthedataFile.open('

Ruby:如何自动添加 "# encoding: UTF-8"?

是否有任何gem可以自动将#encoding:UTF-8添加到每个Ruby文件?或者是否有任何其他方法可以防止整个RubyonRails项目(不仅在单个类中)出现invalidmultibytechar(US-ASCII)错误? 最佳答案 升级到Ruby2.0,因为它使UTF-8成为默认编码,从而消除了对魔术注释的需要。 关于Ruby:如何自动添加"#encoding:UTF-8"?,我们在StackOverflow上找到一个类似的问题: https://st

ruby - 从 Ruby 中的字符串中删除非 UTF 字符?

如何从ruby​​字符串中删除非UTF8字符?我有一个字符串,其中包含例如“xC2”。我想从字符串中删除该字符,使其成为有效的UTF8。这个:text.gsub!(/\xC2/,'')返回错误:incompatibleencodingregexpmatch(ASCII-8BITregexpwithUTF-8string)我也在查看text.unpack('U*')和string.pack,但没有得到任何结果。 最佳答案 您可以为此使用编码。text.encode('UTF-8',:invalid=>:replace,:undef=>

ruby - 我怎样才能避免在 Ruby 1.9 中的每个 UTF-8 文件的顶部放置神奇的编码注释?

我有一个Rails项目,里面有很多西里尔字符串。它在Ruby1.8上运行良好,但Ruby1.9假定源文件是US-ASCII编码的,除非您在源文件顶部提供#encoding:utf-8注释。此时文件不被视为US-ASCII。是否有更简单的方法告诉Ruby“此应用程序是UTF8编码的。请将所有和任何包含的源文件视为UTF8,除非另有声明”?更新:我写了“Howtoinserttheencoding:UTF-8directiveautomaticallyinRuby1.9files”,它会在需要时自动附加编码指令。 最佳答案 我觉得你可以

ruby `encode' : "\xC3"从 ASCII-8BIT 到 UTF-8 (Encoding::UndefinedConversionError)

tvdb中的汉尼拔剧集里有奇怪的角色。例如:Œuf于是ruby吐出:./manifesto.rb:19:in`encode':"\xC3"fromASCII-8BITtoUTF-8(Encoding::UndefinedConversionError)from./manifesto.rb:19:in`to_json'from./manifesto.rb:19:in`'第19行是:puts@tree.to_json有没有办法处理这些非utf字符?我宁愿不替换它们,而是转换它们?还是无视他们?我不知道,感谢任何帮助。奇怪的是脚本通过cron运行良好。手动运行它会产生错误。